[レポート]BUILD TOKYO ONLINE:Snowflakeの生成AIで実現する社内データ活用促進への道筋
2024.12.17
さがらです。
2024年12月17日に、Snowflakeの開発者向けのカンファレンスである「BUILD TOKYO ONLINE」が開催されました。
本記事はその中のセッション「Snowflakeの生成AIで実現する社内データ活用促進への道筋」のレポート記事となります。
登壇者
Snowflake合同会社
セールスエンジニアリング統括本部
アソシエイトパートナーセールスエンジニア
宮川 大司 氏
アジェンダ
Snowflakeにおける生成AIの概要
- AIインフラは、Snowflake Container Services上のGPUを選択することも可能
- Streamlitを用いたAIモデルの活用、Copilotでの開発のサポートなど、幅広くサポート
- Snowflakeではサーバーレスで推論、ファインチューニング、RAG、テキストからSQLへの変換が可能
- カッコ内の数字はモデルごとのパラメータの数を表している
- Snowflakeのモデルは、パラメータが少ないのに精度が高い結果が出ている
Cortex Analystの使い方と導入メリット
- ビジネスユーザーとデータチームで、役割が分かれている
- ビジネスユーザーからの問い合わせが増えると、データチームの負荷が増えてしまう
- Cortex Analyst
- チャットによるセルフサービス分析
- REST APIでの提供
- 推論時にはセマンティックモデルのYAMLで提供されるメタデータを利用
- セマンティックモデルとは
- テーブルやカラムの情報を入れる
- ビジネス特有の計算ロジックを定義
- 主要なLLMのシングルショットのSQL生成や、市場のツールと比較しても精度が高い
- Cortex Analystを通して、ビジネスユーザーとデータチームの橋渡しができる
- Cortex Analystの挙動
- 各SQL生成エージェントがエラーを修正やハルシネーションを起こしてないかを確認して、最終的に統合して該当する結果を返す仕様
- Cortex Analystの新機能
- JOINのサポート
- 連続する会話のサポート
- Cortex Searchとの統合
- Semanti Modelを管理するUI(Snowsight上でYAMLの開発ができるようになる予定)
- Cortex Analystのベストプラクティス
- まずはエンドユーザーの視点で考えること、なぜなら、Cortex Analystの利用者はビジネスユーザーだから
- シンプルに小さな範囲で、クリティカルなところから始めて拡張していく
デモ
- デモ対象のデータ
- どんな質問に回答できるか聞いてみる
- 愛知県の顧客の平均購入金額を聞いてみる
- 2024年4月の売上を聞いてみる
- 愛知県のこれまでの売上の推移を聞いてみる(可視化も可能)
- 答えられない質問の場合:答えられません、と返ってくる(ハルシネーションを起こさない)
- Semantic Modelの中身
- 各テーブルのカラムを元に、dimensionやmeasureを定義
- 最近のアップデートで、relationshipsを定義してJOINできるようになった
- Semanti Model Generator:yamlファイルを自動作成できるOSSのStreamlitアプリ
- yaml生成後に、画面上でチャットをして確認が可能
- verified queryとしてどういった問い合わせをしたらどのような結果が返ってくるかを登録することも可能
- Semantic Model Generatorと同等の機能を、Snowsightで利用できる予定
Cortex Searchの概要
- ドキュメントの非構造化データに対するRAGを提供できる機能
- Enbeddingと検索を、Cortex Searchでサポート
- ベクトル検索とキーワード検索の、ハイブリッドアプローチを採用
- SnowflakeのLLMであるArcticは、XSからLargeの4サイズ展開
- Snowflake RAGロードマップ
- RAGのためのテキスト抽出
- PARSE_DOCUMENT関数で可能
- RAGのためのテキストチャンク化
- SharePointや業界の専門家のドキュメントにも対応予定
- なぜCortex Searchか?
まとめ
- Snowflakeの生成AIは簡単で信頼できる機能
- まだご利用になっていない方には、ぜひ一度試してみてほしい